智能论文笔记

The Past as a Stochastic Process

David H. Wolpert , Michael H. Price , Stefani A. Crabtree , Timothy A. Kohler , Jurgen Jost , James Evans , Peter F. Stadler , Hajime Shimao , Manfred D. Laubichler

分类：机器学习

2021-12-11

历史流程表现出显着的多样性。尽管如此，学者们长期以来一直试图识别模式，并将历史行动者分类和对一些成功的影响。随机过程框架提供了一种结构化方法，用于分析大型历史数据集，允许检测有时令人惊讶的模式，鉴定内源性和外源对过程的相关因果作用者，以及不同历史案例的比较。随机过程的数据，分析工具和组织理论框架的组合使历史和考古中的传统叙事方法补充了传统的叙事方法。

translated by 谷歌翻译

A General Scattering Phase Function for Inverse Rendering

Thanh-Trung Ngo , Hajime Nagahara

分类：计算机视觉

2022-09-28

我们解决了在均质半透明材料中建模光散射并估算其散射参数的问题。散射相函数是影响散射辐射分布的此类参数之一。它是在实践中建模的最复杂，最具挑战性的参数，通常使用经验相位函数。经验相函数（例如Henyey-Greenstein（HG）相位函数）通常会呈现，并限于特定的散射材料范围。这种限制引起了人们对目标材料通常未知的反向渲染问题的关注。在这种情况下，首选更通用的相位函数。尽管使用诸如Legendre多项式\ cite {Fowler1983}之类的基础中存在这种通用相位函数，但此相函数的逆渲染并不直接。这是因为基础多项式在某个地方可能是负面的，而相位函数不能。这项研究提出了一种新型的通用相位功能，可以避免此问题，并使用此阶段函数进行逆渲染应用。通过以MIE散射理论建模的广泛的材料对所提出的相函数进行了积极评估。通过模拟和现实世界实验评估了带有建议的相函数的散射参数估计。

translated by 谷歌翻译

Learning More May Not Be Better: Knowledge Transferability in Vision and Language Tasks

Tianwei Chen , Noa Garcia , Mayu Otani , Chenhui Chu , Yuta Nakashima , Hajime Nagahara

分类：计算机视觉 | 人工智能

2022-08-23

训练视觉和语言模型的更多数据总是更好吗？我们研究多模式任务中的知识可传递性。当前的机器学习趋势是假设通过从不同任务加入多个数据集，其整体绩效将有所改善。但是，我们表明，并非所有知识都会很好地转移或对相关任务产生积极影响，即使它们共享一个共同的目标也是如此。我们基于数百种分为4组的视觉和语言任务进行了数百个跨表现的分析。尽管同一组中的任务容易相互改进，但结果表明并非总是如此。其他因素（例如数据集大小或训练阶段）也对知识的转移程度也有很大的影响。

translated by 谷歌翻译

Privacy-Preserving Action Recognition via Motion Difference Quantization

Sudhakar Kumawat , Hajime Nagahara

分类：计算机视觉

2022-08-04

我们个人空间中智能计算机视觉系统的广泛使用导致人们对这些系统构成的隐私和安全风险的意识增加了。一方面，我们希望这些系统通过理解周围环境来帮助我们的日常生活，但另一方面，我们希望它们这样做而不捕获任何敏感信息。朝这个方向发展，本文提出了一个名为BDQ的简单而强大的隐私保护编码器，用于保护隐私保护人类行动识别的任务，该任务由三个模块组成：模糊，差异和量化。首先，输入场景传递到模糊模块以使边缘平滑。接下来是差异模块，以在连续帧之间应用像素强度减法以突出运动特征并抑制明显的高级隐私属性。最后，将量化模块应用于运动差框架以删除低级隐私属性。 BDQ参数以端到端方式通过对抗训练进行了优化，以便学会允许行动识别属性，同时抑制隐私属性。我们在三个基准数据集上进行的实验表明，与以前的作品相比，建议的编码器设计可以实现最新的权衡。此外，我们表明实现的权衡与基于DVS传感器的活动摄像机相当。代码可在：https：//github.com/suakaw/bdq_privacyar。

translated by 谷歌翻译

Learning Pseudo Front Depth for 2D Forward-Looking Sonar-based Multi-view Stereo

Yusheng Wang , Yonghoon Ji , Hiroshi Tsuchiya , Hajime Asama , Atsushi Yamashita

分类：计算机视觉 | 机器人

2022-07-30

从2D前看声纳中检索声学图像中缺少的维度信息是水下机器人技术领域的一个众所周知的问题。有一些尝试从单个图像中检索3D信息的作品，该信息允许机器人通过飞行运动生成3D地图。但是，由于独特的图像配方原理，估计来自单个图像的3D信息面临严重的歧义问题。多视图立体声的经典方法可以避免歧义问题，但可能需要大量的观点来生成准确的模型。在这项工作中，我们提出了一种基于学习的新型多视角立体方法来估计3D信息。为了更好地利用来自多个帧的信息，提出了一种高程平面扫平方法来生成深度 - 齐路的成本量。正则化后的体积可以视为目标的概率体积表示。我们使用伪前深度来代表3D信息，而不是在高程角度上进行回归，而是可以避免声学成像中的2d-3d问题。只有两个或三个图像可以生成高准确的结果。生成合成数据集以模拟各种水下目标。我们还在大型水箱中构建了第一个具有准确地面真相的真实数据集。实验结果证明了与其他最新方法相比，我们方法的优势。

translated by 谷歌翻译

Automated Grading System of Retinal Arterio-venous Crossing Patterns: A Deep Learning Approach Replicating Ophthalmologist's Diagnostic Process of Arteriolosclerosis

Liangzhi Li , Manisha Verma , Bowen Wang , Yuta Nakashima , Hajime Nagahara , Ryo Kawasaki

分类：计算机视觉 | 机器学习

2020-11-07

The status of retinal arteriovenous crossing is of great significance for clinical evaluation of arteriolosclerosis and systemic hypertension. As an ophthalmology diagnostic criteria, Scheie's classification has been used to grade the severity of arteriolosclerosis. In this paper, we propose a deep learning approach to support the diagnosis process, which, to the best of our knowledge, is one of the earliest attempts in medical imaging. The proposed pipeline is three-fold. First, we adopt segmentation and classification models to automatically obtain vessels in a retinal image with the corresponding artery/vein labels and find candidate arteriovenous crossing points. Second, we use a classification model to validate the true crossing point. At last, the grade of severity for the vessel crossings is classified. To better address the problem of label ambiguity and imbalanced label distribution, we propose a new model, named multi-diagnosis team network (MDTNet), in which the sub-models with different structures or different loss functions provide different decisions. MDTNet unifies these diverse theories to give the final decision with high accuracy. Our severity grading method was able to validate crossing points with precision and recall of 96.3% and 96.3%, respectively. Among correctly detected crossing points, the kappa value for the agreement between the grading by a retina specialist and the estimated score was 0.85, with an accuracy of 0.92. The numerical results demonstrate that our method can achieve a good performance in both arteriovenous crossing validation and severity grading tasks. By the proposed models, we could build a pipeline reproducing retina specialist's subjective grading without feature extractions. The code is available for reproducibility.

translated by 谷歌翻译